实现接近真实机器人的高度准确的运动学或模拟器模型可以促进基于模型的控制(例如,模型预测性控制或线性质量调节器),基于模型的轨迹计划(例如,轨迹优化),并减少增强学习方法所需的学习时间。因此,这项工作的目的是学习运动学和/或模拟器模型与真实机器人之间的残余误差。这是使用自动调节和神经网络实现的,其中使用自动调整方法更新神经网络的参数,该方法应用了从无味的Kalman滤波器(UKF)公式进行方程式。使用此方法,我们仅使用少量数据对这些残差错误进行建模 - 当我们直接从硬件操作中学习改善模拟器/运动学模型时,这是必要的。我们演示了关于机器人硬件(例如操纵器组)的方法,并表明,通过学习的残差错误,我们可以进一步缩小运动学模型,模拟和真实机器人之间的现实差距。
translated by 谷歌翻译